กรอบทางคณิตศาสตร์
เป้าหมายหลักคือการหาเวกเตอร์ $x \in \mathbb{R}^n$ ซึ่งการรวมเชิงเส้น $Ax = x_1a_1 + \dots + x_na_n$ ใกล้เคียงกับ $b$ มากที่สุด ซึ่งมักเรียกว่า การถดถอยของ $b$ ไปยังตัวแปรอธิบาย (คอลัมน์ของ $A$)
เราเน้นที่เวกเตอร์ผลต่าง $r = Ax - b$ ในทางปฏิบัติ เราสมมติว่าเป็นระบบที่มีจำนวนสมการมากกว่าจำนวนตัวแปร ระบบเกินจำนวน โดยที่ $m > n$ ทำไม? เพราะเมื่อ $m = n$ และ $A$ เป็นแมทริกซ์ที่ไม่เป็นเอกลักษณ์ จุดที่เหมาะสมที่สุดก็คือ $A^{-1}b$ ซึ่งทำให้เกิดข้อผิดพลาดเป็นศูนย์ ซึ่งเป็นกรณีที่เรียบง่ายสำหรับการเพิ่มประสิทธิภาพ
รูปแบบที่พบบ่อย
ขึ้นอยู่กับประเภทของข้อผิดพลาดที่เราต้องการลงโทษ จึงเลือกใช้กฎระยะทางที่แตกต่างกัน:
เป็นแนวทางที่พบบ่อยที่สุด มันลดผลรวมของกำลังสองของค่าคงที่: $\|Ax - b\|_2^2$ มันไวต่อค่าเบี่ยงเบนที่มาก แต่ให้คำตอบเชิงวิเคราะห์ผ่านสมการปกติ
ลดค่า สูงสุด ค่าคงที่สัมบูรณ์ $\max_i |r_i|$ ใช้เมื่อการวัดค่าทุกครั้งต้องอยู่ในขอบเขตที่แน่นอน สามารถแก้ไขได้ผ่านโปรแกรมเชิงเส้น (LP) ดังนี้:
หาค่าต่ำสุด $t$
ภายใต้เงื่อนไข $-t\mathbf{1} \preceq Ax - b \preceq t\mathbf{1}$
ลดผลรวม $\sum |r_i|$ วิธีนี้ทนทานต่อค่าเบี่ยงเบนที่มาก เพราะไม่ยกกำลังสองค่าผิดพลาด มันยังแก้ไขได้โดยใช้โปรแกรมเชิงเส้น (LP):
หาค่าต่ำสุด $\mathbf{1}^T t$
ภายใต้เงื่อนไข $-t \preceq Ax - b \preceq t$
บริบทของการประมาณค่า
ในหลายสาขาวิศวกรรม เราสมมติว่าสถานะจริง $x$ ถูกบดบังด้วยเสียงรบกวน: $y = Ax + v$ เป้าหมายของเราคือการหาค่าประมาณ $\hat{x} = \text{argmin}_z \|Az - y\|$ โดยการเลือกกฎระยะทาง เราแท้จริงแล้วกำลังสมมติเกี่ยวกับการแจกแจงทางสถิติของเสียงรบกวน $v$